
GPT-4o数学能力跑分直掉50%,上海AI Lab开始给大模型重新出题了
GPT-4o数学能力跑分直掉50%,上海AI Lab开始给大模型重新出题了新模型在MATH上(以数学竞赛为主)动辄跑分80%甚至90%以上,却一用就废。
新模型在MATH上(以数学竞赛为主)动辄跑分80%甚至90%以上,却一用就废。
Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。
2023年紧急成立的Seed团队,某种程度上承担了AI Lab最初成立时被赋予的角色;
一个理想的GAME Agent是什么样的? 让你分不出来跟你互动的是真人还是AI。 这是带领腾讯AI Lab开发出「绝悟AI」、「绝艺AI」的刘永升的回答,他现在的身份是超参数科技创始人、CEO。
最近,上海 AI Lab、CAMEL-AI.org、大连理工大学、牛津大学、马普所等国内外多家机构联合发布了一个名为 OASIS 的百万级智能体交互开源项目。
OpenAI推出SearchGPT没几天,开源版本也来了。 港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant,模型设计简单,只要两张RTX3090就可复现。
复刻OpenAI o1推理大模型,开源界传来最新进展: LLaMA版o1项目刚刚发布,来自上海AI Lab团队。
Segment Anything Model 2(SAM 2)在传统视频目标分割任务大放异彩,引起了众多关注。然而,港中文和上海 AI Lab 的研究团队发现 SAM 2 的贪婪选择策略容易陷入「错误累积」的问题,即一次错误的分割掩码选择将影响后续帧的分割结果,导致整个视频分割性能的下降。这个问题在长视频分割任务中显得更加严重。
AI coding 是模型推理能力增加之后的下一个竞争高地,除了模型厂商、AI Labs 之外,这个领域的参与者也有着 Cursor 这样的初创团队。
原生多模态大模型性能瓶颈,迎来新突破! 上海AI Lab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。 与非原生模型相比,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准。